ORGANISATION MONDIALE DE LA PROPRIETE INTELLECTUELLE 
Bureau international 




DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITE DE COOPERATION EN MATIERE DE BREVETS (PCT) 



(51) Classification internationale des brevets 5 : 
C12N 15/15, 15/62, C07H 21/04 
O07K 13/00, C12P 21/00 
//A61K 37/02 (C12N 15/15 
C12R 1/865) 


Al 


(11) Numero de publication Internationale: WO 90/13646 
(43) Date de publication internationale: 15 novembre 1990 (15.1 1.90) 


(21) Numero de la demande Internationale : PCT/FR90/00306 

(22) Date de depot international : 27 avril 1990 (27.04.90) 

(30) Donnees relatives a la priorite: 

89/05687 28 avril 1989 (28.04.89) FR 

(71) Deposant (pour tous les Etats designes sauf US): TRANS- 

GENE S.A. [FR/FR]; 16, rue Henri-Regnault, F-92400 
Courbevoie (FR). 

(72) Inventeurs; et 

(75) Inventeurs/Dfcposants (US settlement) : ACHSTETTER, Til- 
man [DE/DE]; Uhlandweg 11, D-7602 Oberkirch (DE). 
NGUYEN, Martine [FR/FR]; 21, rue du Paradis, F- 
67670 Wittersheim (FR). LEMOINE, Yves [FR/FR]; 4, 
rue des Alisiers, F-67100 Strasbourg (FR). REICH- 
HART, Jean-Marc [FR/FR]; 34, rue de Rotterdam, F- 
67000 Strasbourg (FR). 


(74)Mandataire: WARCOIN, Jacques; Cabinet Regimbeau, 
26, avenue Kleber, F-75116 Paris (FR). 

(81) Etats designes: AT (brevet europeen), BE (brevet euro- 
peen), CA, CH (brevet europeen), DE (brevet europeen), 
DK (brevet europeen), ES (brevet europeen), FR (brevet 
europeen), GB (brevet europeen), IT (brevet europeen), 
JP, LU (brevet europeen), NL (brevet europeen), SE 
(brevet europeen), US. 

Publiee 

Avec rapport de recherche internationale, 

Avant l f expiration du delaiprevu pour la modification des 

revendications, sera republiee si de telles modifications sont 

recues. 



(54) Title: APPLICATION OF NOVEL DNA FRAGMENTS AS A CODING SEQUENCE FOR A SIGNAL PEPTIDE FOR 
THE SECRETION OF MATURE PROTEINS BY RECOMBINANT YEAST, EXPRESSION CASSETTES, 
TRANSFORMED YEASTS AND CORRESPONDING PROCESS FOR THE PREPARATION OF PROTEINS 



(54)Titre: APPLICATION DE NOUVEAUX FRAGMENTS D'ADN EN TANT QUE SEQUENCE CODANT POUR UN 
PEPTIDE SIGNAL POUR LA SECRETION DE PROTEINES MATURES PAR DES LEVURES RECOMBI- 
NANTES, CASSETTES ^EXPRESSION, LEVURES TRANSFORMEES ET PROCEDE DE PREPARATION 
DE PROTEINES CORRESPONDANT 

(57) Abstract 

The invention relates to new DNA fragments and to their application as a DNA coding fragment for a signal peptide 
which can be used for the secretion of proteins, said peptide including a sequence of amino-acids which show a degree of corre- 
spondence of at least 60 % with the sequence of amino-acids (I) or (II), preferably with the sequence (II). The sequences (I) and 
(II) are as follows: (I) Arg-Phe-Ser-Thr-Thr-l^u-AIa-Thr-Ala-Ala-Thr-Ala-I^u-Phe-Phe-Thr-Ala-Ser-Gln. (II) Arg-Phe-Ser-Thr- 
TTir-Uu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr-Ala-Ser-GIn-Val-Ser-Ala. 

(57)Abregfe 

L'invention concerne de nouveaux fragments d'ADN et leur application a titre de fragment d'ADN codant pour un pep- 
tide signal utile pour la secretion de proteines, ce peptide comprenant une sequence d'acides amines qui presente un degre d'ho- 
mologie d'au moins 60 % avec la sequence d'acides amines (I) ou (II), de preference avec la sequence (II). Les sequences (I) et 
(II) sont comme suit: (I) Arg-Phe-Ser-Thr-Thr-Uu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr-Ala-Ser-Gln. (II) Arg-Phe-Ser- 
Thr-Thr-Leu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr-AIa-Ser-Gln-Val-Ser-Ala. 
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APPLICATION DE NOUVEAUX FRAGMENTS D'ADN EN TANT QUE 
SEQUENCE CODANT POUR UN PEPTIDE SIGNAL POUR LA SECRETION 
DE PROTEINES MATURES PAR DES LEVURES RECOMBINANTES, 
CASSETTES D'EXPRESSION, LEVURES TRANSFORMEES ET PROCEDE DE 
10 PREPARATION DE PROTEINES CORRESPONDANT. 

La presente invention a pour objet de nouveaux fragment d'ADN et !eur 
utilisation en tant que fragments d'ADN codant pour un peptide signal utile pour 
la secretion de proteines hdterologues par des cellules eucaryotes (animates ou 
15 v6getales) ou procaryotes (bacteries), plus particulierement des levures telles que 
des souches de Saccharomyces. 

Lors de la preparation d'une proteine heterologue par les techniques de 
PADN recombinant, un des objectifs souvent poursuivis est Tobtention d'un 

20 produit qui est secret^ dans le milieu de culture des cellules qui synthetisent la 
proteine h&6roiogue. En effet, dans le cas notamment de la preparation d'une 
proline d'interet industries destinee h etre produites en grande quantite, il est 
souhaitable, afin qu'elle conserve les proprietes desirees, que la proteine soit 
produite sous forme mature, c'est a dire depourvue de tout acide amine ou 

25 sequence peptidique supplemental demeuree fusionnee a la proteine. Par ailleurs, 
il peut etre interessant qu'elle soit sdcretee dans le milieu de culture afin de 
faciliter les operations de recuperation et purification. 
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Les proteines qui sont secretees par une cellule, en particulier par une cellule 
eucaryote, sont tres generalement synthetisees sous forme d'un precurseur 
polypeptidique comprenant un fragment correspondant k la proteine mature (forme 

5 active) et un fragment N-terminal dit fragment "pre", aussi appele peptide signal, 
qui intervient dans ie mecanisme de secretion de la proteine par la cellule. En 
outre, ce precurseur polypeptidique peut comprendre un ou des fragments 
additionnels, appeles fragments "pro". Dans ce dernier cas, le precurseur 
polypeptidique est appele precurseur "pre-pro" ou premier precurseur. Un fragment 

10 "pro" est, dans la majoritd des cas, insere entre le peptide signal et le fragment 
correspondant a la prot6ine mature, bien que ceci ne soit pas une regie absolue. 

Un peptide signal initie (i) Tinsertion de la proline dans la membrane 
cellulaire, (ii) la translocation de la proteine au travels de la membrane cellulaire, 

15 ou (iii) Tentr6e de la proteine dans le reticulum endoplasmique de la cellule en 
vue de la secretion de la proteine par la voie du reticulum endoplasmique. Une 
fois que le peptide signal a rempli son office, il est normalement detache par 
clivage proteolytique pour liberer une proteine mature ou un deuxieme precurseur 
appele precurseur "pro" qui, tout comme le premier precurseur, n'a pas d'activite 

20 biologique, ou qui n'a pas Tactivite complete de la proteine mature. 

Un fragment "pro" est utile dans la mesure ou il bloque ou modifie Tactivite 
de la proteine, permettant ainsi de proteger la cellule contre les effets toxiques 
eventuels de la proline ou de proteger la proteine contre d'eventuelles 
25 . modifications ou degradations. II peut aussi intervenir dans une certaine mesure 
dans le mechanisme de secretion En fin du processus de secretion, le fragment 
"pro" du deuxieme precurseur est detache par clivage proteolytique pour liberer 
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une proteine mature (forme active). 

A la jonction du fragment "pre" et du fragment "pro", ainsi que a la jonction 
du fragment "pro" et du fragment correspondant a la proteine mature, doit se 
trouver un site de clivage proteolytique qui est reconnu par une des proteases de 
la cellule dans laquelle la proteine est synthetisee. Ce site de clivage prot6olytique 
est generalement consiitue d'une sequence de 2 ou 3 acides amines ou plus 
(appelee par la suite sequence de proteolyse) qui est accessible a la protease sur 
le precurseur "pro" et qui, si elle existe sur le fragment correspondant a la proteine 
mature, n'est pas accessible. Trois cas sont a priori possibles, illustr& ci-dessous 
en reference a la jonction des fragments "pre" et "pro": 

ou bien la protease coupe en tSte de sequence et, par consequent, la 
sequence de proteolyse doit se lire sur le fragment "pro"; 
ou bien la protease coupe en queue de sequence et, par consequent, la 
sequence de proteolyse doit se lire sur le fragment "pre"; 
ou bien la protease coupe en milieu de sequence et, par consequent, la 
sequence de proteolyse doit se lire & cheval sur les fragments " pre" et 
"pro". 

20 Ces considerations s'appliquent bien sur de maniere similaire au site de 

clivage place & la jonction du fragment "pro" et du fragment correspondant a la 
proteine mature. 

Pour la construction de precurseurs synthetiques par les methodes du genie 
25 genetique on peut 6tre amene a utiliser des fragments naturels (c'est-a-dire tels que 
trouves dans la nature) et a inserer en bonne place un nouveau site de clivage 
proteolytique ou certains acides amines de maniere a reconstituer un nouveau site 



10 
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de clivage proteolytique en association avec les fragments, ce nouveau site de 
clivage etant bien sur reconnu par une des proteases de la cellule dans laquelle le 
precurseur synthetique est exprime. 

5 Un exemple du type de synthese et du mode de secretion decrit ci-dessus est 

illustre par le cas de la pheromone sexuelle a de la levure S. cerevisiae, aussi 
appele facteur a (code a partir du gene MFal ou MFa2). Le Facteur a est en effet 
synth6tise sous forme de precurseur "pre-pro" tel que decrit dans Kurjan et 
Herskowitz, Cell (1982) 30: 933, La sequence d'acides amines du fragment "pre" 

10 du precurseur du Facteur a est Met Arg Phe Pro Ser He Phe Thr Ala Val Leu Phe 
Ala Ala Ser Ser Ala Leu Ala tandis que celle du fragment "pro" du precurseur du 
Facteur a est Ala Pro Val Asn Thr Thr Thr GIu Asp Glu Thr Ala Gin He Pro Ala 
Glu Ala Val He Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp Val Ala Val Leu Pro 
Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe He Asn Thr Thr He Ala Ser He 

15 Ala Ala Lys Glu Glu Gly Val Ser Leu Asp. 

De maniere surprenante, il a maintenant 6t€ trouve que Pextremite N- 
terminale du precurseur d'une enzyme de levure, cette extremite N-terminale ayant 
la sequence d'acides amines : 

20 Arg-Phe^r-Thr-Thr-Leu-Ate^ 

Val-Ser-Ala, peut etre utilisee a titre de peptide signal pour la secretion de 
proteines heterologies, ainsi que differents variants de cette extremite N-terminale. 
Par "proteine heterologue" on signifie une proteine qui n'est pas produite 
naturellement par la cellule bote ou bien qui est codee par une sequence qui ne 

25 provient pas de la cellule hote. 



Conformement a ceci, la presente invention a pour objet un fragment d'ADN 
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isole qui code pour un peptide dont la sequence d'acides amines presente un degre 
d'homologie d'au moins 60%, de maniere preferentielle d'au moins 80%, avec la 
sequence d'acides amines (I) ou (II), de preference avec la sequence (II). Les 
sequences (I) et (TT) sont comme suit: 
5 (I) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 

Ala-Ser-Gln. 

(II) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
Ala-Ser-Gln-Val-Ser-Ala. 

10 Par "fragment d'ADN isole" on signifie un fragment d'ADN dont l'extremite 

3' n'est pas H6e par iiaison covalente a un fragment d'ADN codant pour une 
enzyme ayant une activity (5-1,3 glucanase telle que en particulier decrite dans 
Klebl & Tanner, J. Bact, Nov 1989, 171: 6259. 

15 Plus particulierement, un fragment d'ADN selon Pinvention code pour un 

peptide comprenant la sequence d'acides amines (HI) suivante : 

(III ) R^Rj-Rj-Thr-Thr-^-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe- 
15 10 

Phe-Thr-Ala-R 5 -R 6 
20 15 19 

dans laquelle: 

Rj est un acide amine selectionne parmi Arg et Lys, 
R 2 et R 6 sont chacun un acide amine selectionne de maniere independante 
parmi Ala, Asn, Cys, Gin, Gly, His, He, Leu, Met, Phe, Pro, Ser, Thr, Trp, 
25 Tyr et Val, 

R 3 et R s sont chacun un acide amin6 selectionne de maniere independante 
parmi Asp, Gly, Asn, Pro et Ser, et 

R 4 est un acide amine selectionne parmi Val, Leu, Ala, Cys, Phe, lie et 
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Met. 



De maniere preferee, un fragment d'ADN selon l'invention code pour un 
peptide comprenant la sequence d'acides amines (IV) suivante: 
5 (IV) Ri-Rj-^.Thr-Thr-R^AIa-THr-AIa-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
AIa-R5-R 6 -R 7 
dans iaquelie : 

R A est un acide amine selection^ panni Arg et Lys, 
R 2 et R 6 sont chacun un acide amine selectionne de maniere independante 
10 parmi Ala, Asn, Cys, Gin, Gly, His, lie, Leu, Met, Phe, Pro, Ser, Thr, Trp, 

Tyr et Val, 

R 3 et R 5 sont chacun un acide amine selectionne de maniere independante 
parmi Asp, Gly, Asn, Pro et Ser, 

R 4 est un acide amine selectionne parmi Val, Leu, Ala, Cys, Phe, lie et 
15 Met, 

R 7 est une sequence de proteolyse. 

R 7 'est preferentiellement une sequence de proteolyse R 8 -R 9 -R 10 dans 
Iaquelie : 

20 R 8 est un acide amine selectionne parmi Ala, Val, Ser, Cys, Gly, He, Leu, 

Thr, 

Rg est un acide amine selectionne parmi Ala, Arg, Cys, Gin, Gly, His, He, 
Leu, Met, Phe, Pro, Ser, Thr, Trp, Tyr et Val et 

R 10 est un acide amin6 selectionne parmi Ala, Cys, Gly, Leu, Pro, Gin, Ser 
25 et Thr. 

Selon l'invention, un fragment d'ADN prefere code pour un peptide 
comprenant une sequence d'acides amines selectionnee parmi les sequences 
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d'acides amines (V), (VI), (VII) et (VIII) suivantes : 

(V) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-AIa-Ala-Thr-Ala-Uu-Phe-Phe-Thr- 
Ala-Ser-Gln 

(VI) Arg-Phe-Ser-Thr-Thr-Val-Ala-Thr-AIa-Ala-Thr-Ala-Leu-Phe-Phe.-Thr- 

5 Ala-Ser-GIn 

(VII) Arg-Phe-Ser-Thr-Thr-Leu-AIa-Thr-Ala-AIa-Thr-Ala-Leu-Phe-Phe- 

Thr-Ala-Ser-Gln-R 7 

dans laquelle R 7 est tel que defini ci-dessus. 

(VIII) Arg-Phe-Ser-Thr-Thr-Val-Ala-Thr-AIa-Ala-Thr-Ala-Leu-Phe-Phe- 
10 Thr-Ala-Ser-Gln-R 7 

dans laquelle R 7 est tel que defini ci-dessus. 

De maniere tout a fait preferee, R 7 est une sequence dans laquelle R 8 est 
Val, R 9 est Ser et R w est Ala. 

15 

II est tout particulierement prefere qu'un fragment d'ADN selon l'invention 
ait pour sequence nucleotidique Tune des sequences (IX), (X), (XI) et (XII) 
suivantes : 

(IX) CGT TTC TCT ACT ACA GTC GCT ACT GCA GCT ACT GCG CTA 
20 TTT TTC ACA GCC TCC CAA, 

(X) CGT TTC TCT ACT ACA CTC GCT ACT GCA GCT ACT GCG CTA 
TTT TTC ACA GCC TCC CAA, 

(XI) CGT TTC TCT ACT ACA GTC GCT ACT GCA GCT ACT GCG CTA 
TTT TTC ACA GCC TCC CAA GTT TCA GCT, 

25 (XH) CGT TTC TCT ACT ACA CTC GCT ACT GCA GCT ACT GCG CTA 
TTT TTC ACA GCC TCC CAA GTT TCA GCT. 
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Les peptides codes par les fragment d'ADN selon 1' invention comprennent 
une region hydrophobe possedant une structure en helice a comprise entre I'acide 
amine en position 3 et 1'acide amin6 en position 18. Cette structure contribue a les 
rendre aptes a une utilisation comme peptide signal. II est connu que la partie 
5 hydrophobe des sequences signal est composee en majorite des acides amines Ala, 
Cys, Phe, He, Leu, Met, Val. On peut done aussi prevoir que certaines 
modifications d'acides amines n'engendrent pas de modification dans ['aptitude 
du peptide signal a jouer son role, 

10 Sous un autre aspect, l'invention propose par consequent Papplication d'un 

fragment d'ADN selon ['invention a titre de fragment d'ADN codant pour un 
peptide signal utile pour la secretion d'une proteine heterologue par une cellule 
h6te dans laquelle la proteine heterologue est synthetisee. D'une maniere generate, 
l'invention peut etre mise en oeuvre dans une cellule procaryote ou eucaryote, de 

15 preference dans cette deraiere. La cellule eucaryote peut etre par exemple, une 
cellule de mammifere ou de levure. De maniere tout a fait preferee, la secretion 
d'une proteine het6rologue a i'aide d'un peptide signal code par un fragment selon 
l'invention est realisee par une cellule de levure, par exemple du genre 
Saccharomyces, plus particulidrement de l'espece 5. cerevisiae. 

20 

Bien entendu, en tant que fragments d'ADN codant pour un peptide signal, 
les fragments d'ADN selon l'invention seront precedes d'un codon d'initiation de 
la traduction, g^neralement d'un codon codant pour une methionine, en particulier 
un ATG. 

25 

Les fragments d'ADN selon l'invention peuvent etre utilises pour la 
construction d'une cassette d'expression d'une proteine, precedes du codon 
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d'initiation, seuls ou en combinaison avec d'autres composants, par exemple un 
fragment "pro". Ces fragments d'ADN peuvent etre prepares par synthase 
chimique, au moyen d'un synthetiseur d 'oligonucleotides par une technique connue 
de l'homme du metier. 

5 

V invention eoncerne egalement une cassette d 'expression d'une proteine 
heterologue comprenant un fragment d'ADN selon T invention a titre de fragment 
d'ADN codant pour le peptide signal de la dite proteine heterologue. De maniere 
detaillee, une cassette d'expression selon 1'invention qui comporte done 
10 1'information necessaire a la secretion d'une proteine heterologue mature 
comprend, de fagon sequentielle, au moins: 

a) un fragment d'ADN comportant des signaux d' initiation de 
transcription et de traduction, 

b) un fragment d'ADN selon 1'invention, 

15 c) un fragment d'ADN codant pour une proteine heterologue mature 

(avec codon de fin de traduction). 

Dans une premiere variante, on peut fusionner directement le fragment b) 
en phase avec le fragment c), dans la mesure oil, a la jonction du fragment b) et 
20 du fragment c), il existe une sequence d'ADN codant pour un site de clivage 
proteolytique de maniere a permettre la liberation d'une proteine mature en fin du 
processus d'expression et de secretion. 

De maniere pr6f6ree, la sequence d'ADN codant pour un site de clivage 
prot6olytique se lit sur le fragment b). 

25 

Dans une deuxieme variante, une cassette d'expression selon 1'invention 
comprend en outre un fragment d'ADN b') codant pour un fragment peptidique 
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"pro"- Ce fragment b') est fusionne en phase avec le fragment b) et le fragment 
c), dans la mesure ou, a ia jonction des fragments b) et b') d'une part et des 
fragments b') et c) d'autre part, il existe une sequence d' ADN codant pour un site 
de clivage proteolytique. 

5 

De nombreux fragments b') peuvent etre utilises dans les cassettes selon 
Tinvention. En particulier, divers fragments b') peuvent etre construits de maniere 
synthetique. Atitre d'exemple, on indique ci-dessous la construction d'un fragment 
b') synthetique a partir de la sequence d'ADN codant pour le fragment "pro" du 

10 precurseur du Facteur a. Cette sequence peut etre utilisee en totalite ou en partie. 
Dans un mode de realisation particulier, on utilise cette sequence deletee de la 
partie codant pour les acides amines en position 3 a 42 sur le fragment "pro"; 
c'est-a-dire la sequence codant pour : Ala Pro Gly Leu Leu Phe He Asn Thr Thr 
De Ala Ser He Ala Ala Lys GIu Glu Gly Val Ser Leu Asp. Pour former le 

15 fragment b'), cette derniere sequence d'ADN est suivie d'une sequence codant 
pour (i) un peptide comprenant un site de clivage proteolytique ou (ii) un site de 
clivage proteolytique, ce dernier mode de realisation etant prefere. Tout 
particulierement, ce dernier site de clivage est Lys-Arg ou Arg-Arg, celui-ci etant 
reconnu par Tendopeptidase de levure yscF qui est codee par le gene KEX2 et qui 

20 coupe au niveau de Textremite C-terminale du dipeptide Lys-Arg ou Arg-Arg- En 
resume, un fragment b') particulier code pour Ala Pro Gly Leu Leu Phe He Asn 
Thr Thr He Ala Ser He Ala Ala Lys Glu Glu Gly Val Ser Leu Asp Lys Arg. 

La sequence a) comprend en particulier un promoteur fonctionnel dans la 
25 cellule dans laquelle on souhaite synthetiser la proteine heterologue codee par le 
fragment c), de preference un promoteur fonctionnel chez la levure. On peut citer 
par exempie des promoteurs constitutifs de levure dont la fonctionnalite a ete 
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confirmee par la transcription de genes codant pour des proteines heterologues 
codant pour des proteines heterologues tels que les promoteurs PGK, ENOl, 
MFal, ou encore des promoteurs inductibies, tels que PH05, GALL Par exemple, 
lorsqu'on utilise dans la cassette d'expression des elements du g£ne MFal de 
5 levure, on pourra utiliser le promoteur du g£ne MFal. 

Enfin, les cassettes d'expression peuvent aussi comprendre un fragment 
d'ADN d) comportant des signaux de terminaison de la transcription, de 
preference fonctionnels chez la levure, par exemple celui du gene PGK. 

10 

De fagon generate, une cassette d'expression selon Tinvention peut dtre 
introduite dans une cellule procaryote ou eucaryote, de preference eucaryote telle 
que cellule de mammifere ou de levure; une cellule de levure etant tout 
particulierement preferee. Cette introduction peut etre realis6e en placant la 
15 cassette dans un plasmide a replication autonome ou dans une construction 
destinee a V integration pour etre introduite directement dans le genome de la 
levure, de maniere a obtenir dans les deux cas une cellule transformer 

Lorsque le plasmide est autonome, il comportera des 61ements assurant sa 
20 partiton et sa replication; par exemple, une origine de replication telle que celle 
du plasmide 2\x de levure. En outre, le plasmide pourra comporter des Elements 
de selection tels que le gene URA3 ou LEU2 qui assurent la complementation de 
levure ura3 ou leu2. En particulier, on pourra avantageusement utiliser le gene 
URA3 delete de son promoteur (URA3-d). 

25 

Ces plasmides peuvent egalement comporter des elements assurant leur 
replication dans les bacteries, lorsque le plasmide doit etre un plasmide navette, 
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par exemple une origine de replication telle que celle du pBR322, un gene 
marqueur de selection tel que Amp R et/ou d'autres elements connus de l'homme 
du metier. 

5 En accord avec ce qui precede, la presente invention concerne egalement 

une cellule transformee par (i) un fragment d'ADN seion 1' invention ou (ii) une 
cassette d'expression selon Tinvention, soit insereedans un plasmide, soit integree 
dans le genome de la cellule. 

Lorsque Ie promoteur est celui du gene MFal, la cellule de levure 
10 transformee est de preference de type sexuel MATa. On utilisera, par exemple, 
une souche de genotype ura3 ou leu2 ou autre, complementee par le plasmide pour 
assurer le Maintien du plasmide dans la levure par une pression de selection 
appropriee. 

15 Enfin, Tinvention a pour objet un procede de preparation d'une proteine 

heterologue, caracterise en ce que Ton cuitive un cellule selon 1' invention et, en 
ce que Ton recupere la dite proteine dans le milieu de culture. Ce procede 
s'appiique a la preparation de toute proteine de nature heterologue. Parmi ces 
proteines, on peut notamment citer l'hirudine ou des defensines, par exemple la 

20 defensine A. 

Plus particulierement, T invention concerne un procede de secretion de 
rhirudine sous forme mature a partir des soucbes de levures transformees selon 
Tinvention. 

25 

Uinvention s'appiique tout particulierement bien a la production 
d'hirudine, c'est pourquoi un des exemples illustratife de 1* invention concerne cette 
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proteine. En effet l'hirudine, dont la source principale se trouve dans ies glandes 
salivaires des sangsues m6dicinales est un inhibiteur tres sp6cifique et tres efficace 
de la thrombine. II s'agit done d'un agent therapeutique tres interessant dont 
Tutilisation en clinique exige une tres grande purete du produit, et qui est done un 
5 candidat interessant a la production par genie genetique. 

Un certain nombre de variants naturels de l'hirudine ont ete identifies et 
designs par HV1, HV2, HV3. Par la suite ces variants naturels ainsi que d'autres 
analogues ont et£ prepares par genie genetique dans diverses cellules hotes, 

10 comme cela est decrit par exemple dans les publications europeennes de brevet 
EP-A-0200655, EP-A-0273800 au nom de la Demanderesse. La comparaison de 
l'hirudine synthetisee par Escherichia coli (£ coli) et par une levure du genre S. 
cerevisiae a montre que l'hirudine synth6tisee par E. coli reste intracellular et 
doit done etre purifiee a partir d*un trts grand nombre de polypeptides de E. coli. 

15 D est done particulierement interessant de pouvoir faire exprimer un gene de 
Thirudine dans la levure de fa$on a obtenir une hirudine secretee sous forme 
mature, et sans que la levure ne produise de substances pyrogdnes ou toxiques 
pour rhomme. 

20 L'invention s'applique done & toutes les molecules d'hirudines, e'est a dire, 

variants naturels de I'hirudine tel quels ou ayant subi une ou plusieurs mutations 
tout en conservant leur activite antithrombotique, ce dernier type de variant etant 
appele analogue. Les exemples ci-apres concerneront plus particulierement 
Tanalogue design^ par rHV2Lys47 (pour recombinant variant HV2 ayant subi une 

25 mutation de 1'acide amine Asp en position 47 en acide amine Lys), decrit dans la 
publication de brevet EP-A-02738000 deja mentionnee. 
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L'invention s'applique egalement a la production de defensines. Les 
defensines, aussi appeiees phormicines, sont des peptides originellement extraits 
de rhemolymphe des certains insectes, les Dipteres, qui ont une activite 
bactericide sur les germes Gram-positifs. Ces defensines sont plus amplement 

5 decrites dans la demande de brevet europeenne EP-A- 349 451. La defensine A 
est un peptide basique ayant pour sequence Ala Thr Cys Asp Leu Leu Ser Gly Thr 
Gly He Asn His Ser Ala Cys Ala Ala His Cys Leu Leu Arg Gly Asn Arg Gly Gly 
Tyr Cys Asn Gly Lys Gly Vai Cys Val Cys Arg Asn. La defensine B ne difffcre 
de la defensine A que par I'acide amine en position 32 ou une arginine remplace 

10 une glycine. 

Les exempies ci-apres permettront de mettre en evidence d'autres 
caracteristiques et avantages de la pr&ente invention. Ces exempies seront illustres 
par les figures suivantes : 
15 - la figure 1 represente la structure schematique du plasmide pTG2958. 

la figure 2 represente la structure schematique des vecteurs M13TG3839 

et M13TG3841. Pour M13TG3839 les cadres hachures aux extremites 

correspondent a M13TG103 et pour M13TG3841 & M13TG3149. 

la figure 3 represente la structure schematique du vecteur M13TG3845. Le 
20 cadre hachure correspond k M13TG3149. 

la figure 4 represente la structure sch6matique du plasmide pTG3828. 

la figure 5 represente la structure schematique du plasmide pTG3864. 



25 
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EXEMPLE 1 : Construction des vecteurs d'expression de l'hirudine : 

pTG3864, pTG3867, pTG3894 et pTG3884. 

A. Construction du vecteur M13TG3845 
5 Le plasmide pTG2958 (figure 1) est peu different du plasmide pTGl833 

decrit dans la publication europeenne de brevet EP-A-252854 porteur de la 
sequence codante pour rHV2Asp47- Le plasmide pTG2958 ne contient pas le site 
de restriction Hindin artificiellement introduit. Le plasmide pTG2958 contient : 

- un fragment de 1217 paires de bases correspondant & la region 5' du gene 
10 MFal (contenant le promoteur, la sequence codant pour le peptide signal, la 

region "pro" et une sequence codarit pour le peptide Lys-Arg), et 4 paires de 
bases (site BgllP, traitement par Klenow), 

- un fragment de 234 paires de bases contenant 1'ADN complementaire de 
rHV2Lys47, 

15 - un fragment de 243 paires de bases comprenant le terminateur PGK de levure, 

- le fragment PvuH-EcoRI de pBR322 comprenant entre autres I'origine de 
replication de ce plasmide et le gene de resistance a l'ampicilline (2292 paires 
de bases), 

• le fragment EcoRI-HindHI du plasmide 2y. de la levure (forme B), contenant 
20 le gene LEU2 de levure, sous forme deletee et insere dans le site PstI, 

- un fragment Hindlll-Smal du gene URA3 de levure. 

Le fragment Ncol-Ncol du vecteur pTG2958 qui porte les sequences 
LEU2-d, 2\x et URA3 est remplace par le fragment Ncol-Ncol de pTG2800 decrit 
dans la publication europeenne de brevet EP-A-O268501 qui porte les sequences 
25 du plasmide 2\i et du gene URA3 d61ete de son promoteur (URA3-d) pour donner 
pTG2877. 

Le vecteur M13TG3839 (figure 2) derive de M13TG103 [Kieny, M.P. et 
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al. (1983) Gene 26, 91-99] dans lequel le fragment Hindm-HindHI de pTG2877 
est introduit dans le meme site. Un site de restriction Sail est introduit dans ce 
vecteur en aval du codon de terminaison de traduction de la region codant pour 
rHV2Lys47 par mutagenese dirigee a I'aide de ('oligonucleotide suivant : 
5 5* CAATGAAAAATGGTCGACTATCAATCATAG pour donner M13TG3839 
Sail. Un site de restriction SphI est alors introduit en amont de la cassette 
d'expression en eliminant la sequence URA3-d par mutagenese dirigee a I'aide de 
l'oligonucleotide suivant : 

5' GACGGCCAGTGAATTGGCATGCTATTGATAAGATTTAAAG pour donner 

10 M13TG3840. 

Le vecteur M13TG131 [Kieny M.P. et al. (1983) Gene 26, 91-99] est dive 
par PstL les extremites rendues- tranche par traitement a I'aide du fragment 
Klenow de I'ADN polymerase I pour etre ensuite religue sur lui meme pour 
donner M13TG3160. Ce vecteur est ensuite clive par Smal et EcoRV puis religue 

15 pour donner M13TG3149. 

Le fragment Sphl-Sall de M13TG3840 (decrit ci-dessus) portant la cassette 
d'expression de rHV2Lys47 (sans sequence tenninatrice de transcription) est 
introduit dans le site Sphl-Sall de M13TG3149 pour donner M13TG3841 (figure 
2). 

20 La sequence codant pour les acides amines en position 3 a 42 sur le 

fragment "pro" du precurseur de MFal est eliminee de M13TG3149 par 
mutagenese dirigee et un site de restriction Smal introduit en utilisant 
Toligonucieotide suivant : 

5' CTCCGCATTAGCTGCTCCCG pour donner ce que 

25 Ton appelle par la suite une sequence "pro" del&6e. 

On obtient ainsi M13TG3842. Un site de restriction BamHI detruisant I' ATG du 
precurseur du facteur a est introduit dans ce vecteur par mutagenese dirigee avec 
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1 'oligonucleotide suivant : 

5' AAT ATAAACG ATT AAAAGG ATCCG ATTTCCTTCAA' 1 ' I'l ' l'l ' A 

On obtient alors M13TG3843. Apres phosphorylation, les oligonucleotides 

suivants: 

5 5 ' GATCCGTTTCTCTACTACAGTCGCTACTGCAGCTACTGCGCTATT 

GCAAAGTGATGATGTCAGCGATG 5 ' 

et 

5 ' TTTCACAGCCTCCCAAGTTTCAGCTGCTCCC 
ACGTCGATGACGCGATAAAAAGTGTCGGAGGGTTCAAAGTCGACGAGGG 5 ' 

10 sont inseres dans le vecteur M13TG3843 coupe par BamHI et Smal introduisant 
ainsi la sequence XI done sans ATG. De maniere a restaurer l'ATG, le site BamHI 
est elimine par mutagenese dirigee en utilisant 1 'oligonucleotide suivant : 
5' AATATAAACGATTAAAAGAATGCGTTTCTCTACTACAGTC 
pour donner le vecteur M13TG3845 (figure 3) qui comporte : 

15 - le promoteur du gene MFal, suivi d'un codon ATG, en tant que fragment a) 

- la sequence XI en tant que fragment b), 

- la sequence "pro" deletee du gene MFal, suivi des codons codant pour Lys-Arg 
en tant que fragment b'), 

- la sequence codant pour rHV2Lys47 en tant que fragment c), 
20 - une partie du vecteur M13TG3149. 

B. Construction du plasmide pTG3864 

Le plasmide pTG848 decrit dans la publication europeenne de brevet 
EP-A-0252854 est dig6re par Bglll puis religue pour donner pTG2886. Le grand 
25 fragment HindlH-EcoRI de pTG2886 est ligue en presence de ligase T4 au 
fragment Hindlll-EcoRI de 2,1 kb du plasmide pFLl [Parent, S.A. et al. (1985) 
Yeast 1, 83-138] qui porte la sequence du plasmide 2\i de 5. cerevisiae pour 
donner le plasmide pTG2886 LEU2-d, URA3-d. Le fragment Hindin de 0,9 kb du 
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plasmide pTG2800 decrit dans la publication europeenne de brevet EP-A-0258501 
portant le gene URA3-d est aiors insere dans le site Hindlll de ce plasmide pour 
donner pTG2886 URA3-d, delta LEU2-d. Le fragment Smal-Bglll de M13TG131 
[Kiehy et al. (1983) Gene 26, 91-99] qui possede plusieurs sites de restriction est 
5 ensuite introduit dans ce plasmide pour donner pTG3828 (figure 4) qui comporte: 

- la sequence du gene URA3 deletee de son promoteur (URA3-d), 

- des sites de restriction venant de M13TG131 permettant I'insertion des elements 
de 1'expression d'un gene heterologue, rHV2Lys47 dans le cas present, 

- le terminateur de transcription du gene PGK de levure 

10 - un fragment de pBR322 qui permet la replication et la selection chez E. coli, 

- un fragment du plasmide 2|x qui possede les elements structuraux necessaires 
a la replication et a l'equipartition mitotique dans la levure. 

Le fragment Sphl-Sall du vecteur M13TG3845 (figure 3) est introduit dans 
le plasmide pTG3828 digere par SphI et Sail pour donner le vecteur d 'expression 
15 pTG3864 (figure 5). 

C. Construction du vecteur d'expression pTG3867 

Pour supprimer completement la sequence codant pour le precurseur du 
gene MFal on effectue une mutagenese dirigee sur M13TG3845 (figure 3) a 

20 l'aide de 1 'oligonucleotide suivant : 

5' GCCTCCCAAGTTTCAGCTATTACGTATACAGACTGC 
pour obtenir le vecteur M13TG3846. Le fragment Sphl-Sall de ce vecteur est 
introduit dans le plasmide pTG3828 (figure 4) digere par SphI et Sail pour donner 
le vecteur d'expression pTG3867. Dans ce vecteur, la sequence XI et celle codant 

25 pour rHV2Lys47 sont adjacentes. Pour obtenir la structure schematique de ce 
plasmide, il suffit sur la figure 5 de retirer la sequence "pro" deletee de MFal. 
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D. Construction du vecteur d'expression pTG3894 

Un site Smal est cree dans la sequence codant pour le fragment "pro" du 
precurseur du facteur a par mutagenese dirigee sur M13TG3841 (figure 2) grace 
a 1'oligonucleotide suivant : 
5 5* TCCGCATTAGCTGCTCCCGGGAACACTACAACAGAA 

pour obtenir M13TG3869. Ce vecteur est ensuite digere par SphI et Smal, le petit 
fragment est isol6 et il est ligu€ au grand fragment SphI et Smal de M13TG3845 
(figure 3) pour donner le vecteur M13TG3891. Le fragment Sphl-Sall de ce 
vecteur est introduit dans le plasmide pTG3828 (figure 4) ouvert aux sites SphI 
10 et Sail pour donner le vecteur d'expression pTG3894 qui comporte done la 
sequence "pro" du precurseur du facteur a mutee. Pour obtenir la structure 
schematique de ce plasmide, il suffit sur la figure 5 de remplacer la sequence 
"pro" deletee de MFal par la sequence "pro 11 mutee. 

E. Construction du vecteur depression pTG3884 
La sequence XI est modifiee par mutag6nese dirigee sur M13TG3845 en 

utilisant 1'oligonucleotide suivant : 
5' GTTTCTCTACTACACTCGCTACTGC 

La modification d'une seule base donne la sequence XII et induit le remplacement 
d'une valine par une leucine en tant qu'acide amine R 4 du peptide signal. On 
obtient ainsi le bacteriophage M13TG3846. Le fragment Sphl-Sall de M13TG3846 
est introduit dans le plasmide pTG3828 (figure 4) ouvert aux sites SphI et Sail 
pour donner le vecteur d 'expression pTG3884 qui comporte : 

- la sequence du gene URA3 d61etee de son promoteur (URA3-d), 

- le promoteur du gene MFal, suivi d'un codon ATG, en tant que fragment a), 

- la sequence XII en tant que fragment b), 

- la sequence "pro" deletee du gene MFal, suivi des codons codant pout Lys- 
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Arg, en tant que fragment b'), 

- la sequence codant pour rHV2Lys47 en tant que fragment c), 

- Ie terminateur du gene codant pour PGK de la levure. 

- un fragment de pBR322, 

5 - un fragment du plasmide 2\i. 



EXEMPLE 2 : Production de rHV2Lys47 dans le suraageant de culture en 

fonction du plasmide utilise. 

10 Une souche de levure de Pespece Saccharomyces cerevisiae de genotype 

MATa, ura3-25 1,-373,-328, leu2-3,-112, his3, pep4-3 est transformee par les 
plasmides pTG3864, pTG3867, pTG3894 et pTG3884 par la methode de l'acetate 
de lithium [Ito, H. et al J. Bacteriol. (1983) 153: 163] et les prototrophes Ura+ 
sont selectionnes. Us sont ensuite mis en culture en erlenmeyer a 30°C sur un 

15 milieu selectif (0,7% de bases azotees pour levures (Yeast Nitrogen Base), 0,5% 
de casamino acides et 1% de glucose). Apres 48 heures de culture, on s6pare 
cellules et suraageant par centrifugation et V activitd inhibitrice de la thrombine est 
determinee dans le suraageant en utilisant le test colorimetrique (activite 
prot^olytique sur un substrat synthetique, le chromozyme TH - Boehringer 

20 Mannheim). Le tableau I presente les resultats des dosages; chaque valeur 
correspond a la moyenne de deux experiences independantes. Uactivit6 de 
rHV2Lys47 est exprimde en ATU/ml de suraageant. 
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Tableau I 



Plasmide 


ATU/ml 


pTG3894 


40 


pTG3864 


50 


pTG3867 


130 


pTG3884 


125 



10 Dans tous les cas on mesure une activit6 anti-thrombine. La proline 

rHV2Lys47 produite par la levure est done excr&ee dans le surnageant. Dc plus 
elle est secret6e sous forme active. Les meilleurs resultats sont obtenus pour les 
souches transformees par pTG3884 et pTG3867. 

Le contenu en proteine des surnageants est analyse par HPLC. Le pic 

15 majeur obtenu correspond bien a celui de rHV2Lys47 (sous sa forme a 65 acides 
amines) et la determination de la sequence N-terminale confirme Pobtention d'une 
molecule correctement synth&isee. 

EXEMPLE 3 : Construction d'un vecteur d'expression de la defensine A 
20 d'insectes : pTG4826. 

A. Synthese d'une sequence d'ADN codant pour la defensine A d'insecte. 

La synthese se fait en deux blocs assembles gr&ce a leurs extremites 
cohesives KpnI. Le premier bloc comprend 3 oligonucleotides numerotes de 1 a 
25 3 et le second bloc, 6 oligonucleotides numerotes de 4 a 9. Leur sequence et la 
position des oligonucleotides (demiere ligne du tableau; les ronds representent la 
partie 5' de l'oligonucleotide) sont donnes dans le tableau n. 
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TABLEAU E 



10 



15 



20 



25 



4 



8 



9 



Sequence 



5' AGCTTGGACAAGAGAGCTACCTGTGACTTGTTGTCCGGTAC 



5' GGTAGCTCTCTTGTCCA 



5' CGGACAACAAGTCACA 



5' CGGTATTAACCACTCCGCTTGTGCTGCTCACTGTTTGTTG 



5' AGCACAAGCGGAGTGGTTAATACCGGTAC 



5' AGAGGTAACAGAGGTGGCTACTGTAACGGTAAGGGTGT 



5' AGTAGCCACCTCTGTTACCTCrCAACAAACAGTGAGC 



5' TTGTGTTTGTAGAAACTAAGGATCCG 



5'AATTCGGATCCTTAGTTTCTACAAACACAAACACCCTTACCGT 
TAC 



8 



La sequence obtenue est la suivante : 

HindHI +1 Kpnl 

10 * 
AGC TT G GAC AAG AGA GCT ACC TGT GAC TTG TTG TCC GGT ACC 

Ala Thr Cys Asp Leu Leu Ser Gly Thr 

20 

GGT ATT AAC CAC TCC GCT TGT GCT GCT CAC TGT TTG TTG AGA 
Gly He Asn His Ser Ala Cys Ala Ala His Cys Leu Leu Arg 
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GGT AAC AGA GGT GGC TAC TGT AAC GGT AAG GGT GTT TGT GTT 
Gly Asn Arg Gly Gly Tyr Cys Asn Gly Lys Gly Val Cys Val 

5 40 BamHI-EcoRI 

TGT AGA AAC TAA GGATCCG 
Cys Arg Asn 

La synthese du premier bloc utilise les oligonucleotides 4, 5, 6, 7, 8 et 9 et 
10 s'effectue de la fagon suivante : 

- les oligonucleotides 5, 6, 7 et 8 sont tout d'abord phosphoryles a leur 
extremites 5' pour eviter la formation de polymeres au cours de l'assemblage. 
Pour chacun de ces oligonucleotides, 100 picomoles sont traitees a la 
polynucleotide kinase, 2 unites dans un volume final de 20 |xl de Tris HC1 60 

15 j*M a pH 7,5; 10 |aM de MgCl 2 ; 8 \xM de dithiothreitol (tampon de kination) 

contenant 3,3 picomoles d'ATPy marque avec 32 P (5000 Ci/mmole). Apres 15 
minutes d'incubation a 37°C, 5 (xmoles d'ATP non marque sont ajoutees. 

- apres incubation a 37°C pendant 30 min. 75 picomoles des oligonucleotides 5, 
6, 7 et 8 sont melanges, chauffes a 95°C pendant 3 min., puis les 

20 oligonucleotides 4 et 9 sont ajoutes dans un volume final de 90 ptmoles de 

tampon de kination decrit ci-dessus. L'ensemble est chauffe a 95°C pendant 3 
min. puis refroidi lentement en 2 heures a 37°C. 

- 25 picomoles de ces oligonucleotides hybrides sont soumis au traitement par la 
ligase T4 pendant une heure a 15°C. Ce melange reactionnel (1 picomole) est 

25 ensuite ajoute a 50 ng du du bacteriophage M13TG131 [Kieny M.P. et al. 

(1983) Gene 26, 91-99] trait£ par EcoRI et Kpnl (1 heure a 15°C). Le melange 
de ligation est utilise pour transformer les cellules competentes de la souche E. 
coli JM103 [Messing J. et al. (1981), Nucleic Acid Res. 9, 309]. Un clone 
presentant la sequence recherch6e est isol6, il est appele M13TG3821. 

30 La synthese du second bloc utilise les oligonucleotides 1, 2 et 3 et 

s'effectue selon la meme procedure que celle decrite pour la synthese du premier 
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bloc. Dans ce cas, seul roligonucieotide 2 est phosphoryle a son extremite 5'. 

Ce second bloc est clone entre les sites Hindffi et Kpnl du bacteriophage 
M13TG3821 et un clone portant la sequence d'ADN codant pour la defensine A 
(figure 5) est isoie, il est appele M13TG3849. 

5 

B. Construction du plasmide depression de la defensine A: pTG4839. 

Le fragment SphI - Smal de 1045 paires de bases du bacteriophage 
M13TG3846 decrit precedemment (Exemple 1, E.) est transfere dans le vecteur 
M13TG3869 decrit prec6demment (Exemple 1, D.) preaiablement digere par SphI 
10 et Smal On obtient ainsi le vecteur M13TG4803 qui porte : 

- le promoteur du gene MFal, suivi d'un codon ATG, 

- la sequence XII, 

- la sequence "pro" mut6e du gene MFal suivi des codons codant pour Lys-Arg, 

- la sequence codant pour rHV2Lys47. 

15 Afin de remplacer la sequence codant pour rHV2Lys47 par celle codant 

pour la defensine A d'insecte on introduit un site HindlH dans la sequence codant 
pour "pro" mutee de MFal a Taide de ^oligonucleotide de sequence : 
5' GAAGGGGTAAGCTTGGATAAA 

Puis on introduit le fragment HindlE - BamHI de M13TG3849 dScrit 
20 precedemment (Exemple 3, A.) qui porte la sequence synthetique codant pour la 

defensine A dans ce vecteur preaiablement traite par Hindlll et BamHI pour 

eliminer la sequence codant pour rHV2Lys47. 

Le fragment Sphl-Sall de M13TG4813 est introduit dans le plasmide 

pTG3828 (figure 4) ouvert aux sites SphI et Sail pour donner le vecteur 
25 d'expression pTG4839 qui comporte : 

- la sequence du gfcne URA3 deletee de son promoteur (URA3-d), 

- le promoteur du gene MFal, suivi d'un ATG, 
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- la sequence XII, 

- la sequence "pro" mutee du gene MFal suivi des codons codant pour Lys-Arg, 

- la sequence synthetique codant pour la defensine A d'insectes, 

- le terminateur du gene codant pour PGK de la levure. 
5 - un fragment de pBR322, 

- un fragment du plasmide 2\i. 

EXEMPLE 4 : Production de defensine A dans le surnageant de culture. 

10 Une souche de levure de Pespfcce Saccharomyces cerevisiae de genotype 

MATa, ura3-25 1,-373,-328, leu2-3,-112, his3, pep4-3 est transformee par le 
plasmide pTG4839 par la methode de Tacetate de lithium [Ito, H. et al J. 
Bacteriol. (1983) 153 : 163] et les prototrophes Ura+ sont s61ectionnes. lis sont 
ensuite mis en culture en erlenmeyer a 30°C sur un milieu selectif (0,7% de bases 

15 azotees pour levures (Yeast Nitrogen Base), 0,5% de casamino acides et 1% de 
glucose). Aprds 48 heures de culture, on separe cellules et surnageant par 
centrifugation et le surnageant est filtr6 sur un filtre de 22 \x puis passe sur 
cartouche Sep-Pak C18. Le materiel fixe est elue avec 60% d'acetonitrile, 0,1% 
d'acide trifluoro acetique dans de Teau et seche sous vide. L'activite 

20 antibacterienne de la defensine A est ensuite mise en evidence par un test 
d'6talement sur agar ou sur gelose ensemenc6 de germes bacteriens (Micrococcus 
luteus) conformement a la procedure decrite par Lambert et al (1989) PNAS 86: 
262-266. 

Dans le surnageant des levures transformees par le plasmide pTG4839 on 
25 d6tecte effectivement une activite antibacterienne. La proteine defensine A 
produite par la levure est done excretee dans le surnageant. De plus elle est 
secretee sous forme active. 
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Le contenu en proteine des sumageants est analyse par HPLC. Le pic 
majeur obtenu correspond bien & celui de la defensine A d'insecte et la 
determination de la sequence de la proteine confirme l'obtention d'une molecule 
correctement synthetisee. 
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REVINDICATIONS 

1. Un fragment d'ADN isole qui code pour un peptide dont ia sequence 
d'acides amines presente un degre d'homologie d'au moins 60% avec la sequence 
d'acides amines de formule (I) ou (II) 

(I) Arg-Phe-Ser-Thr-Thr-Uu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
Ala-Ser-Gln et 

(II) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
Ala-Ser-Gln-Val-Ser-Ala. 

2. Un fragment d'ADN selon la revendication 1 qui code poor un peptide 
dont la sequence d'acides amines presente un degre d'homologie d'au moins 80% 
avec la sequence d'acides amines (I) ou (II) de formule 

(I) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-AIa-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
Ala-Ser-Gln et 

(II) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
Ala-Ser-Gln-Val-Ser-Ala. 

3. Un fragment d'ADN selon la revendication 1 ou 2 qui code pour un 
20 peptide comprenant la sequence d'acides amines (III) 

( III ) Rj-Rj-Rj-Thr-Thr^-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe- 

15 10 
Phe-Thr-Ala-R 5 -R, 
15 19 
25 dans laquelle : 

Rj est un acide amine selectionne parmi Arg et Lys, 

R 2 et R« sont chacun un acide amine selectionne de maniere independante parmi 

Ala, Asn, Cys, Gin, Gly, His, lie, Leu, Met, Phe, Pro, Ser, Thr, Trp, Tyr et Val 



10 



15 
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R 3 et R 5 sont chacun un acide amine selectionne de maniere independante parmi 
Asp, Gly, Asn, Pro et Ser, et 

R 4 est un acide amine selectionne parmi Val, Leu, Ala, Cys, Phe, He et Met. 

5 4. Un fragment d'ADN selon la revendication 1 ou 2 qui code pour un 
peptide comprenant la sequence decides amines (IV) 
(IV) R r R 2 -R 3 -Thr«Thr-R 4 ^ 
Ala-R 5 -R 6 -R 7 
dans laquelle: 

10 R t est un acide amine selectionne parmi Arg et Lys, 

R 2 et R 6 sont chacun un acide amine selectionne de maniere independante parmi 
Ala, Asn, Cys, Gin, Gly, His, He, Leu, Met, Phe, Pro, Ser, Thr, Trp, Tyr et Val 
R 3 et R 5 sont chacun un acide amine selectionne de maniere independante parmi 
Asp, Gly, Asn, Pro et Ser, 

15 R 4 est un acide amin6 selectionne parmi Val, Leu, Ala, Cys, Phe, He et Met, et 

R 7 est une sequence de proteolyse. 

5. Un fragment d'ADN selon ia revendication 4 dans lequel R 7 est une 
sequence de proteolyse R 8 -R 9 -R 10 dans laquelle: 

20 R 8 est un acide amin6 selectionne parmi Ala, Val, Ser, Cys, Gly, He, Leu, Thr, 

R 9 est un acide amine selectionne parmi Ala, Arg, Cys, Gin, Gly, His, He, Leu, 
Met, Phe, Pro, Ser, Thr, Trp, Tyr et Val et 

R xo est un acide amin6 selectionne parmi Ala, Cys, Gly, Leu, Pro, Gin, Ser et 
Thr. 

25 

6. Un fragment d'ADN selon la revendication 1 ou 2 qui code pour un 
peptide comprenant une sequence decides amines s61ectionnee parmi les 
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sequences d'acides amines (V) et (VI) 

(V) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-AIa-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
Ala-Ser-Gln; 

(VI) Arg-Phe-Ser-Thr-Thr-Val-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
5 Ala-Ser-Gln. 

7. Un fragment d'ADN selon Tune des revendications 1, 2, 4 et 5 qui code 
pour un peptide comprenant une sequence d'acides amines s61ectionnee parmi les 
sequences d'acides amines de formule (VII) et (VIII) 

10 (VII) Arg-Phe-Ser-Thr-Thr-Leu-Ala-Thr-Ala-Ala-Thr-Ala-Leu-Phe-Phe-Thr- 
Ala-Ser-Gln-R 7 

dans laquelle R 7 est une sequence de proteolyse; 
(Vm)Arg-Phe-Ser-Thr-Thr-VaI.Ala-Thr-Ala-AIa-Thr-Ala-Leu-Phe-Phe-Thr-Ala- 

Ser-Gln-R 7 

15 dans laquelle R 7 est une sequence de proteolyse. 

8. Un fragment d'ADN selon la revendication 7 qui code pour un peptide 
comprenant une sequence d'acides amines selectionnee parmi les sequences 
d'acides amines de formule (VII) et (VHI) dans lesquelles R 7 est Val-Ser-Ala. 

20 

9. Application d'un fragment d'ADN selon 1'une des revendications 1 a 8, a 
titre de fragment d'ADN codant pour un peptide signal utile pour la secretion 
d'une proteme heterologue par une cellule dans laquelle la proteine heterologue 
est synthetisee. 

25 

10. Application d'un fragment d'ADN selon la revendication 9, caracterise en 
ce que le fragment d'ADN code pour un peptide signal utile pour la secretion 



WO 90/13646 PCT/FR90/00306 

30 



d'une proteine heterologue par une cellule de levure dans laquelle la proteine 
heterologue est synthetisee. 

1L Une cassette d'expression d'une proteine heterologue comprenant au moins: 
5 a) un fragment d'ADN comportant des signaux d'initiation de transcription 

et de traduction, 

b) un fragment d'ADN selon Tune des revendications 1 a 8 et, 

c) un fragment d'ADN codant pour la proteine heterologue mature. 

10 12. Une cassette selon la revendication 11 comprenant en outre un fragment 
d'ADN b') codant pour un fragment peptidique "pro". 

13. Une cassette selon la revendication 12 comprenant un fragment d'ADN b') 
codant pour un fragment peptidique "pro" ayant pour sequence Ala Pro Gly Leu 

15 Leu Phe Be Asn Thr Thr He Ala Ser De Ala Ala Lys Glu GIu Gly Val Ser Leu 
Asp Lys Arg. 

14. Une cassette selon Tune des revendications 11 a 13, caracterisee en ce le 
fragment a) comporte un promoteur fonctionnel dans une cellule de levure et un 

20 codon d'initiation de traduction ATG. 

15. Une cassette d 'expression selon Tune des revendications 11 a 14, 
caracterisee en ce que le fragment d'ADN c) code pour une hirudine. 



25 



16. Une cassette d'expression selon la revendication 15, caracterisee en ce que 
le fragment d'ADN c) code pour le variant hirudine rHV2Lys47, 
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17. Une cassette d'expression selon Tune des revendications 11 a 14, 
caracterisee en ee que le fragment d'ADN c) code pour une defensine d'insectes. 

18. Une cassette d'expression selon la revendication 17, caracterisee en ce que 
5 le fragment d'ADN c) code pour la defensine A. 

19. Un vecteur plasmidique comprenant une cassette d'expression selon Tune 
des revendications 11 a 18. 

10 20. Un vecteur plasmidique selon la revendication 19, caracterise en ce qu'il 
comporte en fragment du plasmide 2\i de levure. 

21. Un vecteur plasmidique selon la revendication 19 ou 20, caracterise en ce 
qu'il comporte, en tant que gene de selection, le gene URA3 delete de son 

15 promoteur. 

22. Une cellule transformee par un vecteur plasmidique selon Tune des 
revendications 19 h 21 ou ayant integre dans son genome une cassette d'expression 
selon Tune des revendications 11 a 18. 

20 

23. Une cellule de levure selon la revendication 22. 

24. Un precede de preparation d 'une proteine h6terologue, caracterise en ce que 
Ton cultive une cellule selon la revendication 22 ou 23 et, en ce que Ton recupere 

25 la dite proteine dans le milieu de culture. 

25. Un proc6de selon la revendication 24, caracterise en ce que la cellule est 
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une cellule de levure. 

26. Un procede selon la revendication 24 ou 25, caracterise en ce que ladite 
proteine est une hirudine. 

5 

27. Un proc&16 selon la revendication 24 ou 25, caracterise en ce que ladite 
proteine est une defensine d'insectes. 
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